چگونه مقاله دانلود کنم؟

برای دانلود مقاله از SID، ابتدا وارد سایت شوید، عنوان مقاله را جستجو کرده و بر روی گزینه 'دانلود مقاله' کلیک کنید.

چگونه مقاله ISI دانلود کنم؟

برای دانلود مقاله ISI در SID، کلمه کلیدی یا عنوان مقاله را در نوار جستجو وارد کرده و نتایج مرتبط را مشاهده کنید. سپس روی مقاله مورد نظر کلیک کرده و گزینه 'دانلود مقاله' را انتخاب کنید.

چگونه میتوانم به پایگاه داده SID دسترسی داشته باشم؟

برای دسترسی به پایگاه داده SID، وارد سایت SID.ir شوید، یک حساب کاربری ایجاد کنید و سپس با ورود به حساب خود به منابع علمی دسترسی پیدا کنید.

آیا دانلود مقاله از SID رایگان است؟

بعضی از مقالات در SID بهصورت رایگان در دسترس هستند، اما برخی دیگر نیاز به پرداخت هزینه دارند. اطلاعات بیشتر در صفحه مقاله مشخص شده است.

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

DATA MINING BASED FUZZY CLASSIFICATION ALGORITHM FOR IMBALANCED DATA

نویسندگان:

XU L. | CHOW M. | TAYLOR L.S.

نشریه:

PROCEEDINGS OF IEEE INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS

اطلاعات دوره:

سال:
2006
دوره:
-
شماره:
-
صفحات:
0-0

کلیدواژه:

چکیده:

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 160

دانلود 0

استناد 1

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

SPECIAL ISSUE ON LEARNING FROM IMBALANCED DATA SETS

نویسندگان:

CHAWLA N. | JAPKOWICZ N. | KOLCZ A.

نشریه:

ACM SIGKDD EXPLORATIONS

اطلاعات دوره:

سال:
2004
دوره:
6
شماره:
1
صفحات:
1-6

کلیدواژه:

چکیده:

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 282

دانلود 0

استناد 1

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

ON MINING FUZZY CLASSIFICATION RULES FOR IMBALANCED DATA

نویسندگان:

RAHMANIAN MOHSEN | MANSOORI EGHBAL | ZAREIAN JAHROMI MEHDI

نشریه:

JOURNAL OF ADVANCES IN COMPUTER RESEARCH

اطلاعات دوره:

سال:
2012
دوره:
3
شماره:
2
صفحات:
1-9

کلیدواژه:

IMBALANCED DATA-SETS

FUZZY RULE BASED CLASSIFICATION SYSTEMS

DATA-MINING

چکیده:

Fuzzy rule-based classification system (FRBCS) is a popular machine learning technique for classification purposes. One of the major issues when applying it on imbalanced data sets is its biased to the majority class, such that, it performs poorly in respect to the minority class. However many cases the minority classes are more important than the majority ones. In this paper, we have extended the basic FRBCS in order to decrease the side effects of imbalanced data by employing data-mining criteria such asconfidence and support. These measures are computed from information derived from data in the sub-spaces of each fuzzy rule. The experimental results show that the proposed method can improve the classification accuracy when applied on benchmark data sets.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 360

دانلود 0

استناد 0

مرجع 7

مقاله نشریه

دانلود

نسخه انگلیسی

عنوان:

ترکیب تکنیک های انتخاب نمونه و داده افزایی برای حل مسئله طبقه بندی مجموعه داده های نامتوازن

نویسندگان:

محقق پرستو | نوفرستی سمیرا | رجائی مهری

نشریه:

مهندسی برق و مهندسی کامپیوتر ایران - ب مهندسی کامپیوتر

اطلاعات دوره:

سال:
1402
دوره:
21
شماره:
4
صفحات:
273-283

کلیدواژه:

انتخاب نمونه Q1

داده افزایی Q1

طبقه بندی Q2

مجموعه داده نامتوازن Q1

داده کاوی Q1

یادگیری ماشین Q1

چکیده:

در عصر کلان داده ها، تکنیک های تجزیه و تحلیل خودکار مانند داده کاوی به طور گسترده ای برای تصمیم گیری به کار گرفته شده و بسیار مؤثر واقع شده اند. از جمله تکنیک های داده کاوی می توان به طبقه بندی اشاره کرد که یک روش رایج برای تصمیم گیری و پیش بینی است. الگوریتم های طبقه بندی به طور معمول بر روی مجموعه داده های متوازن به خوبی عمل می کنند. با وجود این، یکی از مشکلاتی که الگوریتم های طبقه بندی با آن مواجه هستند، پیش بینی صحیح برچسب نمونه های جدید بر اساس یادگیری بر روی مجموعه داده های نامتوازن است. در این نوع از مجموعه داده ها، توزیع ناهمگونی که داده ها در کلاس های مختلف دارند باعث نادیده گرفته شدن نمونه های کلاس با تعداد نمونه کمتر در یادگیری طبقه بند می شوند؛ در حالی که این کلاس در برخی مسائل پیش بینی دارای اهمیت بیشتری است. به منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل سازی مجموعه داده های نامتوازن ارائه می شود که با متعادل نمودن تعداد نمونه های کلاس های مختلف در مجموعه داده ای نامتوازن، پیش بینی صحیح برچسب کلاس نمونه های جدید توسط الگوریتم یادگیری ماشین را بهبود می بخشد. بر اساس ارزیابی های صورت گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه بندی مجموعه داده های نامتوازن به نام های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش های دیگر دارد.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 150

دانلود 29

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

Malware Detection using Deep Neural Networks on Imbalanced Data

نویسندگان:

نشریه:

MAJLESI JOURNAL OF ELECTRICAL ENGINEERING

اطلاعات دوره:

سال:
2022
دوره:
16
شماره:
4
صفحات:
123-129

کلیدواژه:

Malware Detection

Imbalanced Data

Convolutional Neural Networks

SMOTE

Tomek Links

چکیده:

Through the use of malware, particularly JavaScript, cybercriminals have turned online applications into one of their main targets for impersonation. Detection of such dangerous code in real-time, therefore, becomes crucial in order to prevent any harmful action. By categorizing the salient characteristics of the malicious code, this study suggests an effective technique for identifying malicious Java scripts that were previously unknown, employing an interceptor on the client side. By employing the wrapper approach for dimensionality reduction, a feature subset was generated. In this paper, we propose an approach for handling the malware detection task in imbalanced data situations. Our approach utilizes two main imbalanced solutions namely, Synthetic Minority Over Sampling Technique (SMOTE) and Tomek Links with the object of augmenting the data and then applying a Deep Neural Network (DNN) for classifying the scripts. The conducted experiments demonstrate the efficient performance of our approach and it achieves an accuracy of 94. 00%.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 45

دانلود 0

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

ISSUES IN MINING IMBALANCED DATA SETS - A REVIEW PAPER

نویسندگان:

VISA SOFA | RALESCU ANCA

نشریه:

PROCEEDINGS OF MIDWEST ARTIFICIAL INTELLIGENCE AND COGNITIVE SCIENCE CONFERENCE

اطلاعات دوره:

سال:
2005
دوره:
-
شماره:
6
صفحات:
67-73

کلیدواژه:

چکیده:

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 224

دانلود 0

استناد 1

مرجع 0

مقاله همایش

دانلود

عنوان:

A FUZZY DECISION TREE APPROACH FOR IMBALANCED DATA CLASSIFICATION

نویسنده:

Sardari Sahar | EFTEKHARI MAHDI

همایش:

INTERNATIONAL CONFERENCE ON COMPUTER AND KNOWLEDGE ENGINEERING (ICCKE)

اطلاعات دوره:

سال:
2016
دوره:
6

کلیدواژه:

IMBALANCED DATA CLASSIFICATION

FUZZY DECISION TREE

K-MEANS CLUSTERING

چکیده:

RECENTLY, NEW FUZZY DECISION TREE (FDT) APPROACHES HAVE BEEN DEVELOPED FOR DOING CLASSIFICATION TASKS. IN THIS PAPER, ONE OF THESE FDTS IS ADAPTED FOR PERFORMING THE IMBALANCED CLASSIFICATION TASKS. FIRST, OUR PROPOSED METHOD UTILIZES K-MEANS ALGORITHM TO CLUSTER THE MAJORITY CLASS SAMPLES INTO SOME CLUSTERS. THEN, EACH CLUSTER IS LABELED AS A NEW CLASS AND THEREBY THE BINARY IMBALANCED CLASSIFICATION PROBLEM IS CONVERTED TO THE MULTI-CLASS CLASSIFICATION PROBLEM. EVENTUALLY, FDT ALGORITHM IS EMPLOYED FOR CLASSIFYING THE NEW DATA SET. THE OBTAINED RESULTS SHOW THAT OUR PROPOSED METHOD OUTPERFORMS ALMOST ALL THE OTHER FUZZY RULE BASED APPROACHES OVER HIGHLY IMBALANCED DATA SETS.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 146

دانلود 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

Enhancing Learning from Imbalanced Classes via Data Preprocessing: A Data-Driven Application in Metabolomics Data Mining

نویسندگان:

BaniMustafa Ahmed

نشریه:

THE ISC INTERNATIONAL JOURNAL OF INFORMATION SECURITY

اطلاعات دوره:

سال:
2019
دوره:
11
شماره:
3
صفحات:
79-89

کلیدواژه:

چکیده:

This paper presents a data mining application in metabolomics. It aims at building an enhanced machine learning classifier that can be used for diagnosing cachexia syndrome and identifying its involved biomarkers. To achieve this goal, a data-driven analysis is carried out using a public dataset consisting of 1H-NMR metabolite profile. This dataset suffers from the problem of imbalanced classes which is known to deteriorate the performance of classifiers. It also influences its validity and generalizablity. The classification models in this study were built using five machine learning algorithms known as PLS-DA, MLP, SVM, C4. 5 and ID3. This model is built after carrying out a number of intensive data preprocessing procedures to tackle the problem of imbalanced classes and improve the performance of the constructed classifiers. These procedures involves applying data transformation, normalization, standardization, re-sampling and data reduction procedures using a number of variables importance scorers. The best performance was achieved by building an MLP model that was trained and tested using five-fold cross-validation using datasets that were re-sampled using SMOTE method and then reduced using SVM variable importance scorer. This model was successful in classifying samples with excellent accuracy and also in identifying the potential disease biomarkers. The results confirm the validity of metabolomics data mining for diagnosis of cachexia. It also emphasizes the importance of data preprocessing procedures such as sampling and data reduction for improving data mining results, particularly when data suffers from the problem of imbalanced classes.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 213

دانلود 0

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

EXTRACTING RULES FROM IMBALANCED DATA: THE CASE OF CREDIT SCORING

نویسندگان:

SADATRASOUL SEYED MAHDI | GHOLAMIAN MOHAMMAD REZA | SHAHANAGHI KAMRAN

نشریه:

JOURNAL OF INFORMATION SYSTEMS AND TELECOMMUNICATION

اطلاعات دوره:

سال:
2015
دوره:
3
شماره:
1 (9)
صفحات:
22-28

کلیدواژه:

چکیده:

Credit scoring is an important topic, and banks collect different data from their loan applicant to make an appropriate and correct decision. Rule bases are of more attention in credit decision making because of their ability to explicitly distinguish between good and bad applicants. The credit scoring datasets are usually imbalanced. This is mainly because the number of good applicants in a portfolio of loan is usually much higher than the number of loans that default. This paper use previous applied rule bases in credit scoring, including RIPPER, OneR, Decision table, PART and C4.5 to study the reliability and results of sampling on its own dataset.A real database of one of an Iranian export development bank is used and, imbalanced data issues are investigated by randomly Oversampling the minority class of defaulters, and three times under sampling of majority of non-defaulters class. The performance criterion chosen to measure the reliability of rule extractors is the area under the receiver operating characteristic curve (AUC), accuracy and number of rules. Friedman’s statistic is used to test for significance differences between techniques and datasets. The results from study show that PART is better and good and bad samples of data affect its results less.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 644

دانلود 0

استناد 0

مرجع 4

مقاله همایش

دانلود

عنوان:

IMPROVING ROTATION FOREST PERFORMANCE FOR IMBALANCED DATA CLASSIFICATION THROUGH FUZZY CLUSTERING

نویسنده:

Hosseinzadeh Mehrdad | EFTEKHARI MAHDI

همایش:

INTERNATIONAL SYMPOSIUM ON ARTIFICIAL INTELLIGENCE AND SIGNAL PROCESSING (AISP)

اطلاعات دوره:

سال:
2015
دوره:
1

کلیدواژه:

IMBALANCED DATA CLASSIFICATION

ENSEMBLE LEARNING

FUZZY CLUSTERING

چکیده:

IN THIS PAPER, FUZZY C-MEANS CLUSTERING AND ROTATION FOREST (RF) ARE COMBINED TO CONSTRUCT A HIGH PERFORMANCE CLASSIFIER FOR IMBALANCED DATA CLASSIFICATION. DATA SAMPLES ARE CLUSTERED VIA FUZZY CLUSTERING AND THEN FUZZY MEMBERSHIP FUNCTION MATRIX IS ADDED INTO DATA SAMPLES. THEREFORE, CLUSTERS MEMBERSHIPS OF SAMPLES ARE UTILIZED AS NEW FEATURES THAT ARE ADDED INTO THE ORIGINAL FEATURES. AFTER THAT, RF IS UTILIZED FOR CLASSIFICATION WHERE THE NEW SET OF FEATURES AS WELL AS THE ORIGINAL ONES ARE TAKEN INTO ACCOUNT IN THE FEATURE SUBSPACING PHASE. THE PROPOSED ALGORITHM UTILIZES SMOTE OVERSAMPLING ALGORITHM FOR BALANCING DATA SAMPLES. THE OBTAINED RESULTS CONFIRM THAT OUR PROPOSED METHOD OUTPERFORMS THE OTHER WELL-KNOWN BAGGING ALGORITHMS. ...

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 127

دانلود 0

ابتدا 1 2 3 4 5 6 7 8 9 10 انتها ›

بعدی

پایگاه مرکز اطلاعات علمی جهاد دانشگاهی

ISSN: 2588-4824

نتایج جستجو

مرتبط ترین ها

به روزترین ها

پربازدید ترین ها

پر دانلودترین‌ها

پر استنادترین‌ها